智能论文笔记

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

EBHI-Seg: A Novel Enteroscope Biopsy Histopathological Haematoxylin and Eosin Image Dataset for Image Segmentation Tasks

Liyu Shi , Xiaoyan Li , Weiming Hua , Haoyuan Chen , Jing Chen , Zizhen Fan , Minghe Gao , Yujie Jing , Guotao Lu , Deguo Ma

分类：计算机视觉

2022-12-01

Background and Purpose: Colorectal cancer is a common fatal malignancy, the fourth most common cancer in men, and the third most common cancer in women worldwide. Timely detection of cancer in its early stages is essential for treating the disease. Currently, there is a lack of datasets for histopathological image segmentation of rectal cancer, which often hampers the assessment accuracy when computer technology is used to aid in diagnosis. Methods: This present study provided a new publicly available Enteroscope Biopsy Histopathological Hematoxylin and Eosin Image Dataset for Image Segmentation Tasks (EBHI-Seg). To demonstrate the validity and extensiveness of EBHI-Seg, the experimental results for EBHI-Seg are evaluated using classical machine learning methods and deep learning methods. Results: The experimental results showed that deep learning methods had a better image segmentation performance when utilizing EBHI-Seg. The maximum accuracy of the Dice evaluation metric for the classical machine learning method is 0.948, while the Dice evaluation metric for the deep learning method is 0.965. Conclusion: This publicly available dataset contained 5,170 images of six types of tumor differentiation stages and the corresponding ground truth images. The dataset can provide researchers with new segmentation algorithms for medical diagnosis of colorectal cancer, which can be used in the clinical setting to help doctors and patients.

translated by 谷歌翻译

Forgetting to Remember: A Scalable Incremental Learning Framework for Cross-Task Blind Image Quality Assessment

Rui Ma , Qingbo Wu , King N. Ngan , Hongliang Li , Fanman Meng , Linfeng Xu

分类：计算机视觉

2022-09-15

近年来，在各种特定于任务的情况下，盲目图像质量评估（BIQA）取得了巨大的成功，这些方案呈现出不变的失真类型和评估标准。但是，由于刚性结构和学习框架，它们不能应用于交叉任务BIQA方案，在这种情况下，失真类型和评估标准在实际应用中不断变化。本文提出了一个可扩展的增量学习框架（SILF），该框架可以在多个评估任务中依次执行BIQA，具有有限的记忆能力。更具体地说，我们开发了动态参数隔离策略，以依次更新特定于任务的参数子集，这些参数子集彼此之间并非重叠。每个参数子集都会暂时解决，以记住对其相应任务的一个评估偏好，并且可以在以下BIQA中自适应地重复使用先前的参数子集，以根据任务相关性实现更好的性能。为了抑制顺序任务学习中记忆容量的不受限制扩展，我们通过从先前解决的参数子集中逐渐和选择性地修剪不重要的神经元来开发可扩展的内存单元，这使我们能够忘记以前的经验的一部分，并释放有限的内存能力，以适应适应新的新任务。对11个IQA数据集进行的广泛实验表明，我们提出的方法在交叉任务BIQA中的其他最新方法显着优于其他最新方法。

translated by 谷歌翻译

SSL-WM: A Black-Box Watermarking Approach for Encoders Pre-trained by Self-supervised Learning

Peizhuo Lv , Pan Li , Shenchen Zhu , Shengzhi Zhang , Kai Chen , Ruigang Liang , Chang Yue , Fan Xiang , Yuling Cai , Hualong Ma

分类：人工智能

2022-09-08

近年来，在自学学习（SSL）方面取得了重大成功，这有助于各种下游任务。但是，攻击者可能会窃取此类SSL模型并将其商业化以获利，这对于保护其知识产权（IP）至关重要。大多数现有的IP保护解决方案都是为监督学习模型而设计的，不能直接使用，因为它们要求模型的下游任务和目标标签在水印嵌入过程中已知并获得，这在SSL的域中并非总是可以的。为了解决此类问题，尤其是在水印嵌入过程中下游任务多样化且未知时，我们提出了一种新型的黑盒水印解决方案，名为SSL-WM，以保护SSL模型的所有权。 SSL-WM将水印编码器的水印输入映射到不变的表示空间中，该空间会导致任何下游分类器产生预期的行为，从而允许检测到嵌入式水印。我们使用不同的SSL模型（包括基于对比度和基于生成的生成型）来评估许多任务，例如计算机视觉（CV）和自然语言处理（NLP）等许多任务。实验结果表明，SSL-WM可以有效地验证各种下游任务中被盗SSL模型的所有权。此外，SSL-WM对模型进行微调和修剪攻击非常强大。最后，SSL-WM还可以从评估的水印检测方法中逃避检测，从而证明了其在保护SSL模型IP时的有希望的应用。

translated by 谷歌翻译

Provable Adaptivity in Adam

Bohan Wang , Yushun Zhang , Huishuai Zhang , Qi Meng , Zhi-Ming Ma , Tie-Yan Liu , Wei Chen

分类：机器学习

2022-08-21

自适应力矩估计（ADAM）优化器由于其快速收敛属性而广泛用于深度学习任务。但是，亚当的融合仍然不太了解。特别是，对亚当的现有分析不能清楚地证明亚当比SGD的优势。我们将这种理论上的尴尬归因于$ l $ -smooth的条件（即，假设梯度在全球lipschitz连续且常数$ l $）中被文献所采用，而文献经常指出，在实用的神经网络中经常失败。为了解决这一尴尬，我们分析了亚当在轻松的条件下的融合，称为$（l_0，l_1）$平滑度条件，这使梯度Lipschitz常数可以随地梯度规范而变化。 $（l_0，l_1）$严格弱于$ l $ -Smooth条件，并且已经过经验证明可以保留实用的深神经网络。在$（L_0，L_1）$平滑度条件下，我们为Adam建立了与实用的超参数的收敛性。具体而言，我们认为亚当可以适应局部平滑度条件，证明亚当的\ emph {Adpativity}是合理的。相反，在这种情况下，SGD可以任意放慢。我们的结果可能会阐明自适应梯度方法比非自适应方法的好处。

translated by 谷歌翻译

ConTextual Mask Auto-Encoder for Dense Passage Retrieval

Xing Wu , Guangyuan Ma , Meng Lin , Zijia Lin , Zhongyuan Wang , Songlin Hu

分类：自然语言处理 | 人工智能

2022-08-16

密集的段落检索旨在根据查询和段落的密集表示（即矢量）从大型语料库中检索查询的相关段落。最近的研究探索了改善预训练的语言模型，以提高密集的检索性能。本文提出了COT-MAE（上下文掩盖自动编码器），这是一种简单而有效的生成性预训练方法，可用于密集通道检索。 COT-MAE采用了不对称的编码器架构，该体系结构学会通过自我监督和上下文监督的掩盖自动编码来将句子语义压缩到密集的矢量中。精确，自我监督的掩盖自动编码学会学会为文本跨度内的令牌的语义建模，并学习上下文监督的蒙版自动编码学学习以建模文本跨度之间的语义相关性。我们对大规模通道检索基准进行实验，并显示出对强基础的大量改进，证明了COT-MAE的效率很高。

translated by 谷歌翻译

An Empirical Study of Pseudo-Labeling for Image-based 3D Object Detection

Xinzhu Ma , Yuan Meng , Yinmin Zhang , Lei Bai , Jun Hou , Shuai Yi , Wanli Ouyang

分类：计算机视觉

2022-08-15

基于图像的3D检测是自主驾驶感知系统的必不可少的组成部分。但是，它仍然受到不满意的表现，这是有限的培训数据的主要原因之一。不幸的是，在3D空间中注释对象是极度时间/资源消耗的，这使得很难任意扩展训练集。在这项工作中，我们专注于半监督的方式，并探索更便宜的替代方案（即伪标记）的可行性，以利用未标记的数据。为此，我们进行了广泛的实验，以研究伪标签是否可以在不同环境下为基线模型提供有效的监督。实验结果不仅证明了基于图像的3D检测的伪标记机制的有效性（例如，在单眼设置下，我们在没有铃铛和哨声的Kitti-3D测试集上实现了20.23 AP，用于中等水平，从6.03 AP），但还显示了几个有趣且值得注意的发现（例如，经过伪标签训练的模型的性能要比基于相同培训数据的地面真相注释训练的表现更好）。我们希望这项工作可以在半监督环境下为基于图像的3D检测社区提供见解。代码，伪标签和预培训模型将公开可用。

translated by 谷歌翻译

Forecasting Question Answering over Temporal Knowledge Graphs

Zifeng Ding , Ruoxia Qi , Zongyue Li , Bailan He , Jingpei Wu , Yunpu Ma , Zhao Meng , Zhen Han , Volker Tresp

分类：人工智能 | 自然语言处理 | 机器学习

2022-08-12

关于时间知识图（TKGQA）的问题回答最近发现兴趣越来越大。 TKGQA需要时间推理技术来从时间知识库中提取相关信息。唯一现有的TKGQA数据集，即cronquestions，由基于固定时间段内的事实组成，其中跨越同一时期的时间知识图（TKG）可以完全使用用于答案推断，允许使用TKGQA模型。即将根据过去事实回答问题的未来知识。但是，在现实世界的情况下，鉴于到目前为止的知识也很常见，我们希望TKGQA系统回答询问未来的问题。随着人类不断寻求未来计划，建立用于回答此类预测问题的TKGQA系统很重要。然而，这在先前的研究中仍未得到探索。在本文中，我们提出了一个新的任务：关于时间知识图的预测问题。我们还为此任务提出了一个大规模的TKGQA基准数据集，即预测。它包括三种类型的问题，即实体预测，不是和事实推理问题。对于我们数据集中的每个预测问题，QA模型只能在给定问题中注释的时间戳以进行答案推理之前访问TKG信息。我们发现，最先进的TKGQA方法在预测问题上的表现较差，并且他们无法回答不是问题和事实推理问题。为此，我们提出了一种TKGQA模型预测，该模型采用TKG预测模块进行未来推断，以回答所有三种类型的问题。实验结果表明，预测到实体预测问题的最新方法优于最近的TKGQA方法，并且在回答其他两种类型的问题方面也显示出很大的有效性。

translated by 谷歌翻译

PanGu-Coder: Program Synthesis with Function-Level Language Modeling

Fenia Christopoulou , Gerasimos Lampouras , Milan Gritta , Guchun Zhang , Yinpeng Guo , Zhongqi Li , Qi Zhang , Meng Xiao , Bo Shen , Lin Li

分类：机器学习 | 人工智能 | 自然语言处理

2022-07-22

我们提出了Pangu-Coder，这是一种仅预读的解码器语言模型，该模型采用pangu-alpha架构进行文本到代码生成，即给定自然语言问题描述的编程语言解决方案的合成。我们使用两阶段策略训练Pangu-Coder：第一阶段采用因果语言建模（CLM）来预先培训原始编程语言数据，而第二阶段则使用因果语言建模和掩盖语言建模（MLM）的组合培训目标，专注于文本到代码生成的下游任务，并培训松散的自然语言程序定义和代码功能。最后，我们讨论了pangu-coder-ft，该pander the是通过竞争性编程问题和代码与持续集成测试的结合进行了微调的。我们评估了pangu-coder，重点是它是否生成功能上正确的程序，并证明它在参加较小的上下文窗口和较少的数据培训的同时，它比诸如Codex之类的类似大小的模型（例如Codex）实现等效性或更好的性能。

translated by 谷歌翻译

Deep Random Vortex Method for Simulation and Inference of Navier-Stokes Equations

Rui Zhang , Peiyan Hu , Qi Meng , Yue Wang , Rongchan Zhu , Bingguang Chen , Zhi-Ming Ma , Tie-Yan Liu

分类：机器学习

2022-06-20

Navier-Stokes方程是描述液体和空气等流体运动的重要部分微分方程。由于Navier-Stokes方程的重要性，有效的数值方案的发展对科学和工程师都很重要。最近，随着AI技术的开发，已经设计了几种方法来整合深层神经网络，以模拟和推断不可压缩的Navier-Stokes方程所控制的流体动力学，这些方程可以以无网状和可不同的方式加速模拟或推断过程。在本文中，我们指出，现有的深入Navier-Stokes知情方法的能力仅限于处理非平滑或分数方程，这在现实中是两种关键情况。为此，我们提出了\ emph {深入的随机涡流方法}（drvm），该方法将神经网络与随机涡流动力学系统相结合，等效于Navier-Stokes方程。具体而言，随机涡流动力学激发了用于训练神经网络的基于蒙特卡洛的损失函数，从而避免通过自动差异计算衍生物。因此，DRVM不仅可以有效地求解涉及粗糙路径，非差异初始条件和分数运算符的Navier-Stokes方程，而且还继承了基于深度学习的求解器的无网格和可区分优势。我们对凯奇问题，参数求解器学习以及2-D和3-D不可压缩的Navier-Stokes方程的逆问题进行实验。所提出的方法为Navier-Stokes方程的仿真和推断提供了准确的结果。特别是对于包括奇异初始条件的情况，DRVM明显胜过现有的PINN方法。

translated by 谷歌翻译